iT邦幫忙

2025 iThome 鐵人賽

DAY 30
1
生成式 AI

一起來打造 PTT 文章智慧問答系統!系列 第 30

【Day 30】回顧與未來展望 - 總結學習成果與延伸應用方向建議

  • 分享至 

  • xImage
  •  

Hi大家好,
這是我參加 iT 邦幫忙鐵人賽的第 1 次挑戰,這次的主題聚焦在結合 Python 爬蟲、RAG(檢索增強生成)與 AI,打造一套 PTT 文章智慧問答系統。在過程中,我會依照每天進度上傳程式碼到 GitHub ,方便大家參考學習。也歡迎留言或來信討論,我的信箱是 gerryearth@gmail.com


不知不覺,我們已經完成了 30 天的鐵人賽挑戰 。這一路從無到有,從環境建置到智慧問答系統的完成,再到延伸的效能、UX 與最佳化探討,今天就讓我們好好回顧一下這段旅程,並思考未來可以怎麼發展。


30 天學到了什麼?

這次的主題是 打造一個 PTT 文章智慧問答系統,透過 RAG(檢索增強生成)結合 Python 爬蟲、Django、Pinecone、Gemini,我們一步一步完成了以下重點:

系統建置篇

  • Day 01–05
    完成環境建置(Django + MariaDB + Docker),確保系統可攜性
  • Day 06–12
    撰寫 PTT 爬蟲,整合 Celery + Redis,讓爬蟲能自動排程、監控

API 與 RAG 實作篇

  • Day 13–19
    學習 Django REST Framework,實作文章 API
    並串接向量資料庫(Pinecone)與 Gemini,完成「智慧問答」功能

進階優化篇

  • Day 20–24
    探討 RAG 的封裝流程、文章切割策略、Embedding 模型比較
  • Day 25–27
    分享降低成本的方法、Prompt Engineering 技巧,以及多模組結合(檢索 + 摘要)

系統可靠度與體驗篇

  • Day 28–29
    學習如何進行壓測與效能分析,並設計使用者回饋機制,讓系統持續學習

專案成果

完成後,我們擁有一個能夠:

  1. 接收使用者問題
  2. 檢索 PTT 文章(透過 Pinecone 向量搜尋)
  3. 呼叫 Gemini 回答
  4. 回傳答案 + 來源文章

智慧問答 API

這是一個雖然簡單,但完整體現 RAG 概念落地 的專案,非常適合作為入門與教學範例。


未來展望

當然,這個專案還有很多進化空間:

  1. 更強大的檢索能力

    • 引入 reranker 模型(如 bge-reranker-large)
    • 提升搜尋結果的相關性
  2. 多模態支援

    • 除了文字,也能處理圖片或表格(例如 PTT 截圖)
  3. 即時性資料

    • 結合即時爬蟲 + 緩存機制
    • 提供最新的 PTT 熱門討論
  4. 社群化與推薦系統

    • 除了回答問題,也能做「延伸閱讀」或「相關討論串推薦」
  5. 商業應用

    • 改造成 新聞智慧助手客服知識庫企業內部 FAQ 系統

心得與感謝

這是我第一次參加 iT 邦幫忙鐵人賽,30 天的挑戰真的不容易:

  • 要規劃內容、寫程式、截圖、整理文章
  • 甚至還要持續思考怎麼讓知識有「脈絡」

但回頭看,這段過程讓我不只熟悉了 RAG 與 AI 應用開發,也強迫自己把概念講清楚、教會別人,這其實比單純寫程式更有挑戰性。

也非常感謝在過程中留言、按讚、寫信交流的朋友們!
有你們的鼓勵,才讓我能撐到最後一天。


結語

AI 與 RAG 不是遙不可及的技術,而是可以落地、可以幫助我們解決資訊檢索問題的工具。
希望透過這 30 天的文章,大家能更清楚知道:

  • 怎麼從零開始打造一個智慧問答系統
  • 背後的設計考量與最佳化策略
  • 未來如何延伸到更多應用場景

如果你跟我一樣,對 Python & 生成式 AI 開發很有熱情,歡迎繼續交流!

謝謝大家這 30 天的陪伴,我們下次挑戰再見~


上一篇
【Day 29】使用者體驗與回饋機制 - 改善用戶體驗
系列文
一起來打造 PTT 文章智慧問答系統!30
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言